Pig比較不常用,我打算之後再慢慢補充前面兩天關於Pig的文章,
Hive是我比較熟悉的工具,它的初衷是讓不熟悉Java或是MapReduce與Pig的使用者,
可用他們熟悉的SQL語言來進行大資料集的查詢。可以把它看成SQL轉成MapReduce的運算。
長得很奇怪的大象蜂...
在安裝Hive之前,一樣記得要先裝好Hadoop還有HDFS,
此外Hive有一個MetaStore,用來存放MetaData的資料,
內建是使用Derby的資料庫,但是遇到多使用者操作的時候,
會因為Derby一次只有一個連線的限制,而不行操作。所以通常都會使用Mysql或是PostgreSql來存放。